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fS| (57) Abstract: The invention relates to a method for determining competing risks for objects after an initial event based on already 
O measured or otherwise objectifiable training data sets, in which a number of signals obtained from an adaptive system are combined 
Q in an objective function in such a manner that the adaptive system can identify or predict the underlying probabilities of the respective 
Jj"^ competing risks. 
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(57) Zusammenfassung: Die Ertlndung betrifft ein Verfahren zur Ermittlung konkurrierender Risiken fur Objekte nach einem An- 
fangsereignis auf Grundlage bereits gemessener oder sonst objektivierbarer Train ingsdatensatze, in welchem mehrere aus einem 
lernfahigen System gewonnene Signale in einer objektiven Funktion so kombiniert werden, dass das lernfahige System die zugrunde 
liegenden Wahrscheinlichkeiten der jeweiligen konkurrierenden Risiken erkennen oder vorhersagen kann. 
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Verfahren zur Ermittlung konkurrierender Risiken 



Gebiet der Erfindung 

Die Erfindung betrifft ein Verfahren zur Ermittlung konkurrierender Risiken nach einem 
Anfangsereignis mit Hilfe lernfahiger Systeme auf Grundlage bereits gemessener Oder sonst 
objektivierbarer Daten (Trainingsdaten). 

Stand der Technik 

Lernfahige Systeme wie neuronale Netze werden zunehmend zur Risikoabschatzung 
eingesetzt, weil sie in der Lage sind, komplexe, nicht von vornherein bekannte 
Zusammenhange zwischen erhobenen Faktoren und Ausgangen zu erkennen und 
darzustellen. Durch diese Fahigkeit konnen sie zuverlassigere bzw. genauere Abschatzungen 
von Risikowahrscheinlichkeiten liefern als herkommliche Verfahren, welche von einer 
speziellen Gestalt des Zusammenhangs wie etwa einer linearen Abhangigkeit, ausgehen 
miissen. 

Im Bereich medizinischer Anwendungen, beispielsweise bei der Behandlung einer 
Krebserkrankung, ist es bekannt, lernfahige Systeme wie neuronale Netze oder rekursive 
Partitionierung (wie die bekannte Methode CART. ..Classification and Regression Tre es", stehg 
dazu z. B: L. Breiman era/., ..Classification and Regression Trees", Chapman and Hall, New 
York (1984)) zur Bestimmung der Risikowahrscheinlichkeit eines Ereignisses auch bei 
zensierten Daten einzusetzen. (Von einem zensierten Datensatz spricht man, wenn bis zum 
letzten Beobachtungszeitpunkt das Ereignis noch nicht unbedingt eingetroffen ist.) Als Beispiel 
fur die Anwendung lernfahiger Systeme bei einer Krebserkrankung dient die Bestimmung der 
Risikowahrscheinlichkeit (etwa fur eine erneute Erkrankung (Rezidiv)) im AnschluS an der 
Primarbehandlung zur Unterstutzung der Therapieentscheidung. 

Die Faktoren der Datensatze umfassen eine Reihe von objektivierbaren KenngroSen, auf 
deren Werte eine das lernfahige System bedienende Person keinen EinfluB hat. Im Falle eines 
primaren Mammakarzinoms beinhalten diese KenngroBen zum Beispiel 



BNSOOCIO: <WO 0247O26A2J_> 



WO 02/47026 




PCT/EP01/144I1 



• Alter zum Zeitpunkt der Operation, 

• Anzahl der befallenen Lymphknoten, 

• Laborwert des Faktors uPA, 

• Laborwert des Faktors PAI-1 , 

• Kennwert fur die TumorgroRe, 

• Laborwert des Estrogenrezeptors, 

• Laborwert des Progesteronrezeptors. 

Die Art der tatsachlich verwendeten Therapie kann als Angabe erfalit werden, so dass auch 
der Zusammenhang zwischen Therapie und Ausgang erkannt wird. 

Die Werte werden auf einem geeigneten Speichermedium zwischengespeichert und dem 
lernfahigen System zugefuhrt. Die einzelnen Angaben sind in der Regel allerdings zum einen 
mit einer Unscharfe, analog einem Signalrauschen, behaftet. Aus diesen verrauschten 
Einzelsignalen ist es Aufgabe des lernfahigen Systems, veredelte Signale zu bilden, die im 
Rahmen einer geeigneten Wahrscheinlichkeitsdarstellung zu einer Risikoabschatzung fuhren 
konnen. 

Die Lernfahigkeit eines neuronalen Netzes auch fur nichtlineare Zusammenhange ist eine 
Konsequenz der Architektur und der Funktionsweise. Ein sog. „MuItilayer Perzeptron" (in der 
Fachliteratur immer als „MLP" abgekurzt) enthalt etwa eine Eingangsschicht, eine versteckte 
Schicht, und eine Ausgangsschicht Die im neuronalen Netz vorhandenen „versteckten 
_ Knoier£- ecfullen_die Aufgabe, ein Signal fur die Wahrsnheirilichkeit k omplexer i nterner 
Prozesse zu erzeugen. Sie konnen somit uber die zugrunde liegenden, aber nicht von 
vornherein direkt abtastbaren, biologischen Prozesse, welche fur den Vertauf einer Erkrankung 
letztendlich ausschlaggebend sein werden, AufschluB geben. 

Interne biologische Prozesse konnen parallel zu einander mit unterschiedlichen Raten 
stattfinden und auch miteinander in Wechselwirkung treten. Lernfahige Systeme konnen auch 
solche internen, nicht direkt beobachtbaren Prozesse erkennen und darstellen, wobei sich die 
Giite dieser Erkennung nachtraglich und indirekt durch die Gute der Vorhersage der 
tatsachlich beobachteten Ereignisse bemerkbar macht. 
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Durch rekursive Partitionierung (etwa CART) entstehen Zuordnungen, die in ihrer Fahigkeit zur 
Darstellung komplexer interner Zusammenhange analog zu den Fahigkeiten der neuronalen 
Netze sind. 

Der Verlauf einer Erkrankung kann zu unterschiedlichen kritischen Ereignissen fuhren deren 
Vorbeugung eventuell unterschiedliche Therapieansatze erfordert. Im Falle des ersten 
Rezidivs bei Brustkrebs ist eine eindeutige Klassifikation der Befunde etwa in die gegenseitig 
exklusiven Auspragungen 

1. „Femmetastasen in Knochengewebe", 

2. „Femmetastasen, jedoch kein Befund im Knochengewebe" 

3. „Loko-regionales" Rezidiv 
mdglich. 

Da aber der weitere Verlauf der Erkrankung nach einem dieser Befunde auch im Hinblick auf 
die Wahrscheinlichkeiten der ubrigen Auspragungen der Rezidivs beeinfluftt werden kann, ist 
es im Rahmen der statistischen Behandlung solcher Daten oft sinnvoll, nur das Erstrezidiv' zu 
untersuchen. Beispielsweise fur eine Brustkrebspatientin, die 24 Monate nach der 
Primaroperation ein Lokalrezidiv erleidet und nach 48 Monaten den Befund 
..Knochenmetastase" hat, ist im Hinblick auf „ Erstrezidiv" nur Kategorie 3 relevant Die 
Nachbeobachtung Knochenmetastase wird im diesem Rahmen nicht verwendet, d h die 
Patientin ist im Hinblick auf den Befund 1 als ..zensiert" zu betrachten, sobald ein anderer 
Befund (hier Lokalrezidiv) festgestellt worden ist. 

Konkunierende Risiken konnen auch dadurch entstehen, dass ein Patient etwa an einer vollig 
anderen Erkrankung oder an einer Nebenwirkung der Behandlung verstirbt, so dass das Risiko 
der den Arzt interessierenden Auspragung verborgen bleibt. 

Es ist fur Experten zwar relativ offensichtlich, dass eine aussch/ieSliche Klassifikation mit 
Zensierungsvorschrift die Trainingsdaten in eine Gestalt so abbilden kann, dass fur jeden 
meglichen Ausgang je ein neuronales Netz oder je ein Klassifkationsbaum durch rekursive 
Partitionierung nach Stand der Technik trainiert werden kann. Im Beispiel mit den Ausgangen 
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1 bis 3 mulite man hierfur drei vollkommen unabhangige neuronale Netze bzw. drei 
verschiedene Entscheidungsbaume trainieren. 

Ein Problem bei dieser Nutzung des Standes der Technik besteht darin, dass die Erkennung 
einer moglichen Aussagekraft interner Knoten hinsichtlich eines der Erkrankungsausgange fur 
die Erkennung dessen Aussagekraft hinsichtlich der ubrigen Erkrankungsausgange 
verlorengeht. In Wirklichkeit aber konnte ein interner biologischer Prozess, der durch interne 
Knoten in einem neuronalen Netz erkannt worden ist, Beitrage zu mehreren beobachtbaren 
Ausgangen liefern, wenn auch mit unterschiedlicher Gewichtung. Beispielsweise ist die 
biologische Jnvasionsfahigkeit" eines Tumors von unterschiedlicher, jedoch signifikanter 
Bedeutung fur Fernmetastasen bzw. fur lokale Rezidive. Die unabhangig trainierten Netze 
mussen die Aussagekraft eines durch den Knoten dargestellten internen Zusammenhang 
eigenstandig „entdecken". 

Es versteht sich, dass die Anzahl der tatsachlichen Ereignisse, die einem lernfahigen System 
zur Verfugung stehen, analog zur Machtigkeit eines statistischen Systems, die 
Erkennungsgute mitbestimmen. In medizinischen Anwendungen ist diese Anzahl meist 
begrenzt. Infolgedessen ist die Wahrscheinlichkeit, dass sich interne Prozesse knapp 
hinsichtlich eines der Ausgange bemerkbar machen, jedoch nicht hinsichtlich der ubrigen 
Faktoren, relativ grofl. In diesem Fall geht die potentielle Aussagekraft zur Unterscheidung der 
Faktoren, sowie das biologische Erklarungspotential der internen Knoten auch im Hinblick auf 
die weiteren Ausgange, verloren. 

Da Therapien auch Nebenwirkungen haben, ist etwa eine Verringerung des Risikos einer 
Auspragung einer Erkrankung auf Kosten einer Erhohung eines anderen Risikos typisch fur 
den medizinischen Entscheidungskontext Hierfur ist die Notwendigkeit beim gegenwartigen 
Stand der Technik, hinsichtlich jedes einzelnen Risikos ein vollig neues neuronale Netz 
trainieren zu mussen, unbefriedigend. 

Faktoren, deren Wirkung auf die Wahrscheinlichkeit der Ausgange zeitlich variabel sind, 
konnen nach Stand der Technik durch verschiedene Knoten in der Ausgangsschicht 
dargestellt werden, denen verschiedene Zeitabhangigkeiten (etwa durch die bekannte Technik 
der „fraktionalen Polynomen") zugeordnet werden. Eine zeitlich variable Aussage zur 
Ereignisdichte ist beim Stand der Technik zwar mdglich, jedoch ist das Problem der 



BNSDOCID: <WO 0247026A2_I_> 



WO 02/47026 _ - PCt/EPO 1/144 11 



konkurrierenden Risiken nicht so formufierbar, dass die Bestimmung einer zeitlich variablen 
Aussage nicht beeintrachtigt wird. 

Angesichts der Nachteile des Standes der Technik liegt der Erfindung die Aufgabe zugrunde, 
ein Verfahren bereitzustellen, mit dem konkurrierenden Risiken in ihrem logischen bzw. 
ursachlichen Zusammenhang erfaBt, identifiziert und dargestellt werden konnen, insbesondere 
so, dass die Bestimmung einer zeitlich variablen Aussage nicht beeintrachtigt wird. 

Beschreibuna der Erfindung 

Diese Aufgabe wird durch das Verfahren gemafc Patentanspruch 1 gelost 

Durch das erfindungsgema&e Verfahren konnen den konkurrierenden Risiken durch das 
lernfahige System geeignete Kennwerte zugeordnet werden. Diese Kennwerte sollen die 
Berechnung der bedingten Wahrscheinlichkeit pro Zeiteinheit fur das Eintreten des jeweiligen 
Ereignisses (unter der Voraussetzung, dass bisher keines der moglichen Endereignisse 
eingetreten ist) ermoglichen. „Geeignete" Kennwerte im Sinne der Erfindung konnen die 
Eigenschaft haben, dass ein Maximum der statistischen ..Likelihood" betreffend aller Ausgange 
angestrebt wird. 

Es versteht sich, dass dieses Verfahren in verschiedensten Bereichen, wie z B. den 
Ingenieurs- und Wirtschaftswissenschaften, der Biologie oder Medizin, verwendet werden / 
kann. Im Bereich der Medizin kann es sich dann bei den Objekten urn Patienten handeln, die 
nach einer ersten Erkrankung. dem Ausqangsereionis, konkurrierpnrign Ri*i ko n unterliegen. 
eine erneute Erkrankung zu erfeiden. 

Vorteilhafterweise werden fur das Verfahren fur die Trainingsdatensatze gemessene Oder in 
sonstiger Weise objektiv erfalite Daten des Anfangsereignisses und einer Nachbeobachtung 
bis zu einem vorgegebenen Zeitpunkt verwendet. 

Dabei ist es von Vorteil, wenn der letzte Zeitpunkt der Nachbeobachtung explizit in den 
Trainingsdatensatzen verwendet wird. 
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Somit kann durch das erfindungsgemafce Verfahren auch die Nutzung anderer Kennwerte im 
Rahmen eines trainierten lernfahigen Systems ermoglicht werden, soiange sich diese 
Kennwerte analog zur statistischen Likelihood aus den Nachbeobachtungen bilden lassen. 

In einer vorteilhaften Ausfuhrung werden bei der Beobachtung einer Versagensauspragungen 
zu einem Zeitpunkt die anderen Auspragungen ausgeschlossen. Auf diese Weise kann eine 
Auspragung eines Versagens bevorzugt berucksichtigt werden. 

Vorteilhafterweise ist die objektive Funktion L in Abhangigkeit einer Funktion P gegeben: 

Hier sind mit /j die Parameter des lernfahigen Systems gemeint. („LS" steht fur „lernfahiges 
System".) f^^ifj) bezeichnet die Versagensrate der Auspragung k und S^^itj) den 

Erwartungswert des Anteils an Objekten j mit beobachteten Merkmalen x y , welche kein 
Versagen der Auspragung k zum Zeitpunkt t s erleiden. P wird aufgrund des logischen 
Zusammenhangs aus 5 ik bestimmt, wobei 5 jk =1, wenn ein Objekt j ein Versagen der 
Auspragung k zum Zeitpunkt tj erlitten hat und sonst 5 ]k = 0. 

Vorteilhafterweise wird 

i(^;{ X ,,/ y ,<y /i » = n flV^^Y [w^)]"' 

7=1 k=\ 

als objektive Funktion verwendet, wobej s jk und \y jk aufgrund des logischen Zusammenhangs 
aus 5 jk bestimmt werden. 

Es ist von Vorteil, wenn 

y=i *=i 

als objektive. Funktion verwendet wird. 

In einer bevorzugten Alternative wird ein neuronales Netz als lernfahiges System verwendet 
In diesem Fall kann obige objektive Funktion L in Abhangigkeit von Pdie Form haben 
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Von besonderem Vorteil ist es, wenn ein neuronale Netz der Architektur MLP (multilayer 
Perzeptron) verwendet wird. 

In einer anderen bevorzugten Alternative fuhrt das lernfahige System eine rekursive 
Partitionierung durch, wobei 

jedem Objekt einem Knoten zugeordnet wird, 

jedem Knoten die Haufigkeiten Oder Wahrscheinlichkeiten alter Auspragungen zugeordnet 
wird, und 

die Partionierung so durchgefuhrt wird, dass die objektive Funktion optimiert wird, die diese 
Haufigkeiten Oder Wahrscheinlichkeiten statistisch beriicksichtigt 

Vorzugsweise wird das lernfahige System im Rahmen einer Entscheidungshilfe verwendet. 

Es ist von Vorteil, wenn den verschiedenen Wahrscheinlichkeitsfunktionen der 
konkurrierenden Risiken Werte zur Ermittelung einer Strategie zugeordnet werden. Damit kann 
beispielsweise bei einer medizinischen Anwendung der vorliegenden Erfindung eine 
Therapiestrategie ermittelt werden. 

Im folgenden wird das erfindungsgemalie Verfahren zur Ermittlung konkunierender Risiken 
unter Bezugnahme auf die Zeichnung weiter beschrieben. In der Zeichnung zeigen: 

Figur 1 eine Darstellung eines neuronalen Netzes in einer Implementierung als MLP, 

Figur 2 ein Venn-Diagramm konkurrierender Risiken, und 

Figur 3 eine Illustration eines trainierten neuronalen Netzes mit drei konkurrierenden Risiken. 

Die nachfolgend beschriebenen Ausfuhrungsformen beziehen sich auf medizinische 
Answendungen, was aber nicht als Einschrankung zu verstehen ist 
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Die folgende Beschreibung bedient sich der Terminologie der neuronalen Netze der 
Architektur MLP. Die Anwendung auf andere Architekturen der neuronalen Netze sowie fur 
Regressionsbaume ist aber analog und fur Experten unmittelbar ohne weitere Beschreibung 
nachzuvollziehen. 

Insbesondere wird erfindungsgemafJ eine zusatzliche Dimension der Ausgangsschicht des 
lernfahigen Systems eingefuhrt, wobei 

• die zusatzliche Dimension der Ausgangsschicht mindestens zwei Knoten umfa&t 

• die Knoten dieser zusatzlichen Dimension den verschiedenen Ausgangsereignissen 
entsprechen 

• jeder Ausgangsknoten einem Signal zugeordnet wird, 

• die einzelnen Signale jeweils einer Risikofunktion beziiglich der moglichen Ereignisse 
zugeordnet werden. 

• die Signale der Ausgangsfunktionen zu einem Gesamtsignal kombiniert werden 

• das lernfahige System trainiert wird, indem die Werte der Gesamtsignale fur alle 
Datensatze als Objektivfunktion fur das System herangezogen werden 

Ein auf diese Weise trainiertes System unterstutzt den behandelnden Arzt und den Patienten 
beispielsweise bei der Entscheidung fur einen aus mehreren unterschiedlichen 
Therapieansatzen, indem es feststellt, gegen welche der moglichen Auspragungen der 
Rezidivgefahr die Therapie gerichtet werden soli. 



Problemdarstellung und Uberblick 

Das Ziel der individualisierten Patientenprognose mit konkurrierenden Risiken laSt sich 
mathematisch so auffassen, dass mehrere Funktionen U(x) f 2 (x) f 3 (x), ... mit dem lernfahigen 
System, hier mit einem neuronalen Netz NN^x), NN 2 (x), .... zu approximieren sind. Genauer 
gesagt, das neuronale Netz schatzt den Erwartungswert E(y k |x) der stochastischen Variabten 
y k bei beobachteten Merkmalen x: 

^(x)«/,(x) = £(^|x). 
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Schematisch laBt sich das neuronale Netz zunachst bei der aktuellen Implementierung a!s 
MLP im Ausfuhrungsbeispiel wie in Figur 1 darstellen. 

Alle Quadrate stellen hier Neuronen dar. Die oben im Bild dargestellten Neuronen liefem 



• rohe Patientenmerkmale (Beim primaren Brustkrebs beispielsweise uPA, PAI-1, Zahl der 
befallene Lymphknoten, usw.) oder 

• aus diesen Merkmalen bereits aufbereitete GroSen (z.B. Werte bereinigt um Mittelwert oder 
Median und normiert durch Standardabweichung der Werteverteiiung) 
oder 

• durch Vorkenntnisse oder andere statistische Methoden abgeleitete GroSen. 
Diese Neuronen bilden zusammen die Eingangsschicht 

Die mittleren Neuronen bilden die interne Schicht. Es konnen auch mehrere interne Schichten 
vorgesehen sein. Jedes interne Neuron verarbeitet die Signale von den Eingangsneuronen 
und gibt ein Signal weiter. Die mathematische Beziehung zwischen den "Inputs" zu den 
internen Neuronen und ihren "Outputs" wird durch das Einpendeln von synaptischen 
Gewichten gesteuert. 

Die unteren Neuronen liefem Schatzungen fQr die erwunschten Kenngrofcen (z.B. Erwartungs- 
wert des Uberlebens) und bilden die Ausgangsschicht. 

Um dem Netz den unterstellten Zusammenhang f,(x) f 2 (x) f 3 (x), ... beizubringen, stehen m 
Patientinnen zur Verfugung. Jedem Patienten ist ein Datenmuster (x,y) zugeordnet. wobei fur 
konkurrierende Risiken die Ausgangsvariablen y als „Vektoren" (y=[yi,y 2 ,y 3 , ...]) zu verstehen 

sind. Das Netz muG also anhand der Menge der Datenmuster {(x\y 1 ) (x m ,y m )} die zugrunde- 

liegende Dynamik lemen. Der Index als Superskript bezieht sich auf den Patienten. Beim 
Lernen findet nun eine Anpassung der synaptischen Gewichte statt. 

Die in der Ausfiihrungsform verwendete Architektur besteht in einem klassischen 
mehrschichtigen Feedforward-Netz. Neuronen sind wie oben beschrieben in Schichten 
organisiert. Konnektoren bestehen in der Ausfiihrungsform wie folgt 

• Eingangsschicht -» versteckte Schicht 

• Eingangsschicht Ausgangsschicht 

• Versteckte Schicht -> Ausgangsschicht 



entweder 
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Die Verwendung von Konnektoren Eingangsschicht Ausgangsschicht ist zweckmafcig aber 
nicht zwingend zur Funktion der Erfindung, weil sie nicht unbedingt zur Darstellung einer 
Abbildung NN(x) notwendig sind. 

Funktion neuronaler Netze 
Neuronen als Funktionen 

Jedes Neuron empfangt ein Stimulationssignal S, verarbeitet dieses gemali einer 
vorbestimmten Aktivierungsfunktion F(S) und gibt ein entsprechendes Antwortsignal A = F(S) 
aus, das alien nachfolgenden Neuronen zugefuhrt wird, welche noch mit ihm verbunden sind. 
In der Ausfuhrungsform ist die Aktivierungsfunktion der versteckten Schicht der Tangens 
Hyperbolicus. Die Erfindung kann ebenso bei Verwendung anderer Aktivierungsfunktionen wie 
etwa der logistischen Funktion eingesetzt werden. 

Transformationen und Eingangsneuronen 

Die Faktoren werden anfanglich univariat so transformiert, dass sie in einem Intervall der 
GroSenordnung 1 liegen. 



D.h., zuerst wird der Median Xwedian subtrahiert und eine Skalierung der Werte mit einem Faktor 
Xq vorgenommen: Werte uber dem Median werden mit dem 75 %-Quantil skaliert, Werte unter 
dem Median mit dem 25 %-Quantil. Darauf wird noch die Funktion tanh angewandt 

Die Eingangsneuronen haben eine statische Funktion und werden deshalb als Felder 
implementiert, welche die so transformierten Werte weiterreichen. Konzeptuell kann man die 
tanh-Funktion der Gleichung (la) als Aktivierungsfunktion der Eingabeschicht ansehen. 

Versteckte Neuronen 

Gesucht ist der Ausgang des versteckten Knotens h fur Patientin j. Zuerst wird uberpruft, ob 
der versteckte Knoten h noch aktiv ist. Falls aktiv, werden die Eingangssignale mit den 
zugehorigen Gewichten multipliziert urn die Summe w h -x, zu bilden. Genauer gesagt ist das 
Signal zum versteckten Knoten h bei Muster j eine gewichtete Summe der Eingange der 
Gestalt 



^-tanhr^-XMedianVXQ] 



da) 
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wobei w ih das Gewicht des Konnektors vom Eingangneuron i zum versteckten Neuron h, und 
Xi (j) die (skalierte) Antwort des i-ten Eingangsneurons darstellt. Die Antwort des versteckten 
Neurons h ist 

Y h <j)=F h (z h (J)-b h ). (2a) 

Hierbei ist b h das Bias des versteckten Neurons h, das rechentechnisch wie jedes andere 
Gewicht des Netzwerks optimiert wird. Im Ausfuhrungsbeispiel ist die nichtlineare 
Aktivierungsfunktion F h der Tangens hyperbolicus. 

Ausgangsknoten 

Gesucht ist der Ausgang des Ausgangsknotens o fur Patientin j. Zuerst wird Ciberpriift, ob der 
Ausgangsknoten o noch aktiv ist. Konnektoren sowohl von der versteckten Schicht wie auch 
von der Eingangsschicht sind moglich. Fur jeden noch aktiven Konnektor werden die 
zugehorigen Eingangssignale mit den entsprechenden Gewichten multipliziert. 

Das Signal z D wird zunachst gebildet Das Bias des Neurons b D wird abgezogen, und auf 
dieses Resultat wird die Aktivierungsfunktion des Ausgangsneurones o angewandt. Der 
Ausgang 0 0 (j) wird somit zu 

ZoU) = 2>*<*,a>-* # )+2>jf;c/) 

0 0 U) = F A z oU )-bJ (2J3) — 

Die Aktivierungsfunktion der Ausgangsschicht wird im Ausfuhrungsbeispiel als die 
Identitatsfunktion gewahlt. 

Im Ausfuhrungsbeispiel wird das Gesamtbias im Gegensatz zur versteckten Schicht nicht frei 
optimiert, sondem wird so gewahlt, dass das Mediansignal aller Ausgangsneuronen gleich null 
ist. Dies ist mdglich ohne Einschrankung der Allgemeinheit des Modells. Somit verringert sich 
die Anzahl der zu optimierenden Parameter urn die Anzahl der Biasparameter. 

Oberlebensanalyse bei konkurrierenden, zeitvariablen Risiken im 
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Rahmen lernfahiger Modelle 
Bezug zum Lernfahigen System 

Vorgegeben sei ein Patientenkollektiv mit vorhandenen Kovariaten (prognostischen Faktoren) 
x jf die zu einem Anfangszeitpunkt t=0 (etwa zum Zeitpunkt der Primaroperation) gemessen 
wurden, sowie Endpunkten tj. Bei bekanntem Versagen der Auspragung k des j-ten Patienten 
zum Zeitpunkt tj wird 5 jk = 1 (k=1 t 2,3 J ...) definiert, falls zensiert (weiterer Verlauf nach t=tj 
unbekannt) wird 5 jk =0 definiert 

Sei S k (f) der Erwartungswert des Anteils der Patienten zu einem Zeitpunkt t, welche kein 
Versagen der Auspragung k erleiden, wobei S*(oo) = 0 und S k (0) = 1. Es ist zweckmaSig, 
jeweils eine Versagensrate f k (f) und eine „Hazardfunktion" X k (f) gemaB 

dt 

fu(f) < 3a > 
S k (f) 

~[\ozS k (tj\ (3.b) 
gilt. 

Die Interpretation dieser einzelnen Versagensraten ist wie folgt Ware es moglich, die ubrigen 
Auspragungen ohne EinfluB auf die Auspragung k zu vermeiden, so wurde ^(0 die 
beobachtete Versagensrate approximieren. In Wirklichkeit wird f H (f) zwar nicht direkt 
beobachtet. Fur die Nutzung der Erf indung im Rahmen einer Entscheidungshilfe ist jedoch die 
Erfassung aller Auspragungen f^f) notwendig, damit die Wirksamkeit einer Verringerung einer 
Auspragung im Hinblick auf das Gesamtwohl des Patienten berucksichtigt werden kann. 

Bei bekanntem Verlauf der Hazardfunktionen X k (f) erhalt man die S k (f) durch Integration der 
Gl. (3.b) mit der Anfangsbedingung S k (0) =1. 

Vom neuronalen Netz erhalten wir zu einem Zeitpunkt t nach der Primaroperation fur eine 
Patientin mit Kovariaten x eine "Hazardfunktion" X k (f|x), die nun von Kovariaten x abhangt Als 
Modell fur die Hazardfunktion bei vorgegebenen Kovariaten x setzen wir 



zu definieren, so dass 

4(0 = 
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4a|x) = ^ 0 (0^(?|x) (4) 



mit 



h k (t | x) = exp f^B l (t)NN kl (x) 
L/=i 



(5.) 



Die Funktionen werden dem Problem angepaSt gewahit. Moglich sind hier beipielsweise 
Spline-Funktionen. In dem Ausfuhrungsbeispie! werden fur B,(t) fraktionelle Polynome 
bevorzugt, d.h. B, (/) = / </_I)/2 . 



Somit erhalt man 



4>* e^2 w «(^(0j = - ~log(S k (t)) 



(6.) 



Hierbei wird in der zweiten Gleichung *<* als eine Konstante betrachtet. Die Zeitabhangigkeit 
steckt in den Koeffizienten B,(t). Dieses Modell ist ein Proportional-hazards-Modell, falls = 1 
und alle anderen B, verschwinden. Abweichungen von „Proportional-hazards" konnen durch 
Berucksichtigung von Termen B, mit l>1 modelliert werden. 

In einer breiten Klasse von Anwendungen wird eine Objektivfunktion der Gestalt 

J=l V 

optimiert, wobei die Schreibweise zum Ausdruck bringt, dass P (zunachst auf eine noch nicht 
naher spezifizierte Art und Weise) von den jeweiligen Gberlebens- bzw. 
Versagenswahrscheinlichkeiten abhangen darf. Diese Abhangigkeit ist problembedingt und 
geht aus einem logischen Modell fur das Auftreten der verschiedenen Auspragungen hervor. 
Eine bevorzugte Klasse von Objektivfunktionen der Gestalt (7.) lassen sich als statistische 
Likelihoodfunktionen verstehen, wobei fur die Ausfuhrungsform 



gewahit wird 
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Die beiden Argumente f NN(k , X ) und Snwm sind eindeutig bestimmt unter der Voraussetzung, 
dass das neuronalen Netz oder das sonstige lernfahige Modell die entsprechenden Werte fur 
die Ausgangsknoten liefert. Dies ist in der Ausfuhrungsform stets der Fall. 

Hierbei sind s jk und v|/ jk aufgrund des logischen Zusammenhangs aus 5 jk zu bestimmen, wobei 
5 jk =1, wenn der Patient j ein Versagen der Auspragung k zum Zeitpunkt t| erlitten hat und 
sonst 8 ik = 0. Zensierte Datensatze entsprechen Patienten, die gar kein Versagen erlitten 

haben, so dass 5 jk = 0 fur alle k=1,2,3 Die funktionale Abhangigkeit vom Modell wird 

symbolisch durch veranderliche Parameter n gekennzeichnet. Ein Beispiel zur Bestimmung 
von e jk und \yj k wird in der Folge angegeben. 

Die mit n bezeichneten Parameter sind in der Ausfuhrungsform die Gberlebenszeitskalen Xo k 
und die Gewichte des neuronalen Netzwerkes. Der Index j bezeichnet den Patientendatensatz. 

In der Ausfuhrungsform wird das Zeitintegral zur Losung der Gleichung 6 durch die 
Standardmethode „Romberg-lntegration" gelost. Somit kdnnen beliebige Zeitabhangigkeiten 
der Funktionen B ( (t) berucksichtigt werden. 

Zu einem Zeitpunkt t sei S(t) der Erwartungswert des Anteils der Patienten, welche kein 
Versagen irgendeiner der Auspragungen k=1,...,K erlitten hat. In der Ausfuhrungsform ist diese 
GroSe durch das Produkt der einzelnen Wahrscheinlichkeiten geben: 

S(t) = f[S k (t). (9.) 



Spezifikation der Ausfuhrungsform fur ein Beispiel 

Fur eine vollstandige Spezifikation der AusfQhrungsform mussen nun die GroBen y jk und s ^ 
angegeben werden. Im folgenden werden zur Veranschaulichung zwei Fade der 
Ausfuhrungsform hinsichtlich dieser Funktionen vollstandig spezifiziert, die typisch fur die 
Anwendung der Erfindung im Kontext der konkurrierenden Risiken sind. 

Man betrachte eine Erkrankung, bei der das Versagen drei Auspragungen hat. Der Patient 
wird im Monat t (t=1,2, ...) beobachtet. Hierbei kann im Monat t irgendeine Kombination der 
drei Auspragungen oder gar kein Versagen beobachtet werden, so dass der Patient u zensiert" 
ist. Die Situation wird als Venn-Diagramm in der Abbildung 1 veranschaulicht. 
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lm Falle der Krankheit Mammakarzinom konnten die drei Auspragungen etwa 
Knochenmetastasen (B fur "bone", k=1), sonstige Fernmetastasen (D f£ir ..distant", k=2). bzw. 
Lokal/regional (L fur Jocal", k=3) sein. Ein gleichzeitiges Auftreten aller drei Auspragungen im 
Beobachtungsmonat t ist moglich. Es kann aber sein, dass aus klinischen, 
pharmakologischen, oder datentechnischen Griinden die Nachbeobachtung im Monat t nach 
folgender Logik angegeben wird: 

• Knochenmetastasen Q'a/nein) ? 

o Falls ja, dann =1 ej2 =0sj3 =0v sA =0 v|/ J2 =0 \j/ j3 =0 
o Falls nein: sonstige Fernmetastasen fla/nein) ? 

■ Falls ja, danneji=0Ej2=1 £j3=0 y ^ =1 vy j2 =0 y j3 =0 

■ Falls nein: lokal/regional (ja/nein) 

• Falls ja, dann 8^=0 s i2 =0e j3 =1 v j1 =1 Vj2 =i v|/ ^=0 

• Falls nein, dann 8 jt =0 e j2 =0 sj3=0 y n =1 \j/ j2 =1 y j3 =1 

In anderen Worten: 

Bei dieser Zuordnung wird etwa der Beobachtung ..Knochenmetastasen" eine Prioritat 
eingeraumt, so dass nicht gefragt wird, ob die anderen Auspragungen zum Zeitpunkt t 
vorkommen oder nicht. Deshalb ist bei Befund ..Knochenmetastasen ja" der Beitrag zur 
Likelihoodfunktion (8) der j-ten Patientin gemaB dieser Logik offenbar allein durch den Term 
f NN(ij) gegeben (kein Term mit S nn^.) 

Fur den FaJI ,.keine Knochenmetastasen, aber sonstige Fernmetastasen", geht aus der 
Zuordnung ein Beitrag f NN(2j) x S NN{1 4 hervor. 

Fiir den Fall „weder Knochen- noch sonstige Fernmetastasen, aber lokal/regionale 
Erkrankung" geht aus der Zuordnung ein Beitrag f NN(3j) x S m(U1 x S NN(2j) hervor. 

Fur den Fall „zensieiT geht aus der Zuordnung ein Beitrag S NN(1iD x S NN(2j) x S NN(3(D hervor. 

Eine Anwendung der Erfindung fur Messungen, bei denen stets das Vorhandensein bzw. die 
Abwesenheit mehrerer Auspragungen zum Zeitpunkt t beobachtet und berucksichtigt wird, ist 
moglich, wenn die obigen Gleichungen mit entsprechenden Gleichungen fiir die 
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Wahrscheinlichkeit der gleichzeitigen Beobachtung mehrerer Auspragungen bei geschatzten 
Werten der Versagenswahrscheinlichkeiten ersetzt werden. 

Aufbau eines neuronalen Netzes zur Ermittlung konkurrierender 
Risiken 

Fig. 1 zeigt den Aufbau eines neuronalen Netzes mit der Architektur MLP. In diesem Fall 
umfaSt das neuronale Netz 

• eine Eingangsschicht mit einer Mehrzahl von Eingangsneuronen Nj (i fur Jnput neuron") 

• wenigstens eine Zwischenschicht mit Zwischenneuronen N h (h fur „hidden neuron") 

. eine Ausgangsschicht mit einer Mehrzahl von Ausgangsneuronen N Q (o fur „output 
neuron") 

• einer Vielzahl von Konnektoren, die jeweils zwei Neuronen unterschiedlicher Schichten 
miteinander verbinden. 

In der Ausfuhrungsform gemaB Fig. 1 wird eine zweidimensionale Ausgangsschicht 
dargestellt, um die durch die Erfindung vorhandene Moglichkeit zur gleichzeitigen Darstellung 
zeitlich variabler und auch konkurrierender Risiken zu veranschaulichen. Die vereinfachte 
Darstellung von nicht zeitlich variablen Risiken bildet hierbei den Sonderfall, bei dem nur die 
Auspragungsdimension notwendig ist 

Die Anzahl der anfanglich eingesetzten Eingangs-Neuronen H wird ublicherweise 
entsprechend der Anzahl der fur das Patientenkollektiv zur Verfugung stehenden 
objektivierbaren Angaben gewahlt. Nach stand der Technik stehen Verfahren zur Verfugung, 
welche entweder vorab die Anzahl der Eingangs-Neuronen auf ein fur die jeweilige 
Rechenanlage akzeptierendes MaB autornatisch reduzieren Oder aber im Laufe der 
Optimierung uberflussige Eingangs-Neuronen autornatisch entfernen, so dass in beiden Fallen 
die Bestimmung der letztendlich verwendeten Eingangs-Neuronen ohne Eingriff der jeweiligen 
Bedienungsperson erfolgt. 

In der Ausfuhrungsform gemaS Fig. 1 wird die ursprungliche Anzahl der versteckten Neuronen 
durch die ursprungliche Anzahl der Eingangs-Neuronen bestimmt, d.h.. 

N h = N» (10.a) 
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Fur diesen Fall stehen nach Stand der Technik Verfahren zur Verfugung, welche eine giinstige 
Vorbelegung der Konnektoren ermoglichen. 

Die Neuronen der Ausgangsschicht werden in der Ausfuhrungsform gemaft Fig. 1 s.inngemaS 
in einer zweidimensionalen Matrix mit Indizes 

Jtime = li-.-iNtfrne (10. b) 



Jkey - ^....Nkey 



(10.C) 



angeordnet, wobei die Anzahl der ursprunglich aktiven Neuronen der Ausgangsschicht 
gegeben ist durch 

No = N t j me x Ntey (10.d) 

Hierbei bezeichnet der Index J key Signale der jeweiligen Auspragung, wahrend der Index J lime 
das Signale zur jeweiligen Zeitfunktion (etwa „fraktionelle Polynome" Oder Splinefunktionen) 
bezeichnet. Ein mit zwei Indizes J time , J key bezeichnetes Ausgangsneuron tragt demgemaS 
zur Bestimmung des Koeffizients der Zeitfunktion J fime beim Risiko fur die Auspragung J,^ . Die 
Indizes J tey bzw. J, imo entsprechen in der Ausfuhrungsform sinngemaS den Indizes k bzw. I der 
Gleichungen 4 bis 7. Hierbei entsprechen N tey bzw. N Iime in der Ausfuhrungsform sinngemaG 
den Groften K bzw. L dieser Gleichungen. 

Fur die Anwendung im Rahmen der rekursiven Partitionierung stehen ebenfalls Endknoten zur 
Verfugung, die ublicherweise in einer eindimensionalen Reihe angeordnet werden. Nach 
Stand der Technik wird jeder Patient einem solchen Knoten zugeordnet. Ebenfalls nach Stand 
der Technik wird dem Knoten ein Risiko zugeordnet, das als ein (skalares) Signal betrachtet 
werden kann. Die Erfindung ordnet nun jedem Endknoten statt eines Skalars ein Vektor mit 
N te y Indizes zu. 

Lernen 

Fur das Ausfuhrungsbeispiel ist es Ziel des Lernens (Trainings), einen moglichst hohen Wert 
dieser Likelihoodfunktion im Parameterraum zu orten, gleichzeitig aber uberflussige Parameter 
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nach Moglichkeit zu vermeiden. In der Ausfuhrungsform erfolgt das Lernen durch 
Initialisierung, Optimierungsschritte und Komplexitatsreduktion wie folgt: 

Initialisierung 
Univariate Analyse 

Bevor das gesamte Netz mit alien Gewichten trainiert wird, ist es vorteilhaft, eine univariate 
Analyse fur jeden Faktor durchzufuhren. Diese Analyse hat mehrere Anwendungen: 

• Die univariate Starke der Faktoren bzw. deren einzelne prognostische Gute steht fur den 
Vergleich mit dem vollstandigen Netz zur Verfugung. 

• Univariate Analyse dient zur Bestimmung einer Rangfolge der Faktoren fur den Fall, dass 
weniger Eingangsknoten als Faktoren vorhanden sind. 

• Eine Vorbesetzung der Gewichte, die nichtlineare Konfigurationen begunstigt, oder 
wenigstens nicht benachteiligt, laSt sich aus den univariaten Analysen bilden (siehe unten). 

Zunachst wird ein exponentielles Oberlebensmodell mit dem einzigen Parameter X Q bestimmt 
Dieses Modell dient zur Initialisierung und in der nachfolgenden Analyse aulXerdem zur 
Kontrolle. 

Lineare univariate Modelle 

Der nach Gl. (1a) transformierte Wert des j-ten Faktors Xj wird als einzelner Eingang in ein 
„Hetzwerk" betrach***, das aus genau einem linearen Konnektor von diesem Eingangsneuron 
zu einem Ausgangsknoten besteht (d.h., ohne versteckte Knoten). Die Zeitabhangigkeit dieses 
Ausgangsknotens entspricht dem „Proportional-Hazards-Modell u (K=1) fur zensierte Daten. 
Das daraus resultierende Modell hat nur noch zwei freie Parameter der Zeitparameter (Xq) und 
das Gewicht des Konnektors. Diese werden optimiert und zusammen mit der Gute (Likelihood) 
und der Signifikanz fur nachfolgende Zwecke in einer Tabelle gespeichert. 

Nichtlineare univariate Modelle 

Als nachstes wird jeweils fur jeden Faktor eine Anpassung mit vier Parametem an ein 
nichtlineares univariates Modell vorgenommen. Hier wird die Transformation des j-ten Faktors 
mit dem Ergebnis Xj als M Eingangsneuron" betrachtet. Das univariate „Netzwerk u besteht nun 
aus diesem einen Eingangsneuron, einem einzigen versteckten Neuron, und einem einzigen 
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Ausgangsneuron (ohne tinearen Konnektor zwischen Eingangs- und Ausgangsneuron). Die 
Zeitabhangigkeit dieses Ausgangsknotens entspricht wie oben dem „Proportional-Hazards- 
Modell" (K=1) furzensierte Daten. 

c 

Die vier Parameter entsprechen jeweils der Zeitkonstante (X 0 ), dem Gewicht und dem Bias zur 
versteckten Schicht, sowie dem Gewicht zur Ausgangsschicht. Diese werden optimiert und 
zusammen mit der Gute (Likelihood) und der Signifikanz fur nachfolgende Zwecke in einer 
Tabelle gespeichert. 

Rangfolge der Eingangsvariablen 

Nachdem fur jeden Faktor die univariaten Modelle bestimmt worden sind, wird die Rangfolge 
der univariat signifikanten Faktoren gemafc der Betrage der linearen Gewichte bestimmt. Die 
Numerierung der Eingangsknoten fur die nachfolgende Analyse entspricht dieser Rangfolge. 
Fur den Fall, dass weniger Eingangsknoten ais Faktoren zur Verfugung stehen, eriaubt diese 
Prozedur eine objektive Vorselektion der "wichtigsten" Faktoren. 

Vorbesetzung der Gewichte 

Fur die Optimierung des Netzes (Trainieren) mussen zunachst Anfangswerte fur die Gewichte 
gesetzt werden. Hierbei wird eine Vorbesetzung mit dem genauen Wert Null nicht angestrebt. 
In der Ausfuhrungsform werden zunachst die Gewichte der linearen Konnektoren wie ublich 
mit kleinen Werten vorbesetzt Der Zeitparameter wird mit dem aus dem 1-parametrigen 
Modell bestimmten Wert Xo vorbesetzt. Die Anzahl der versteckten Knoten H wird gleich der 
Anzahl der Eingangsknoten J gewahlt. Nun wird der Konnektor von Eingangsneuron j zum 
versteckten Neuron mit dem gleichen Index h=j zunachst mit dem unter "nichtlineare univariate 
Modell e " bestimmten Gewicht vorb e s e tzt D e r entsprech e nde Bias wird analog mit dem so — 
bestimmten Bias vorbesetzt. Diese beiden GroBen werden dann urn einen kleinen zufalligen 
Betrag versetzt. Daher entspricht jeder Ausgang eines versteckten Knotens etwa dem 
univariat optimalen nichtlinearen Wert 

Fur jeden versteckten Knoten h steht der Wert des aus der univariaten Optimierung 
gewonnenen Gewichts, die wir hier als w h1 bezeichnen, zum ersten Neuron der 
Ausgangsschicht ebenso zur Verfugung. Urn nun die Gewichte zur Ausgangsschicht zu 
Initialisieren, werden die GroSen w h1 , h=1,...,H mit H Zufallszahlen gewichtet. Man wahlt in der 
Ausfuhrungsform dazu H Zahlen aus einer Gleichverteilung auf [0,1] und dividiert jede Zahl 
durch die Summe. AnschlieSend werden diese und alle ubrigen Konnektoren (d.h., Gewichte 
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von der versteckten Schicht zu Neuronen der Ausgangsschicht mit k=2, usw.) urn einen 
kleinen zufalligen Betrag versetzt. 

Eine zweite, fur neuronale Netze ublichere Moglichkeit der Initialisierung besteht darin, alien 
Konnektoren kleine, zufallige Gewichte zuzuordnen. Damit befinden sich am Anfang der 
Optimierung alle Verknupfungen, auch die uber die versteckte Schicht, im linearen Bereich. 
Fur kleine Argumente ist die "Aktivierungsfunktion" fast linear, z.B., tanh(x) » x fur kleines x. 

Lineare Statistik der Eingangsfaktoren 

in der Ausfuhrungsform wird die Kovarianzmatrix aller Eingangsfaktoren berechnet und 
gespeichert. Bestimmt wird auch eine lineare Regression jedes Faktors auf alle andere 
Faktoren: X 2 « A Xi + B. Eigenvektoren und Eigenwerte der Kovarianzmatrix werden 
berechnet und protokolliert. Die linearen Beziehungen werden in der Ausfuhrungsform fur die 
verschiedenen Ausdunnungsverfahren verwendet 

Zuordnung der Patientendaten in Trainings- und Validierungsmengen 

Fur ein lernfahiges System ist es ublich, die vorhandenen Muster zufallig in Trainings- 
Validierungs- und Generalisierungsmengen zu unterteilen. Beispielsweise kann der Benutzer 
Prozentsatze (auch null) aller Muster vorgeben, die fur die Validierung bzw. Generalisierung 
reserviert sind. Die Generalisierungsmenge wird zum Training uberhaupt nicht berticksichtigt, 
um nachtraglich eine vollstandig unvoreingenommene Uberprufung der Gute zu ermoglichen. 
Die Gute auf der Validierungsmenge, falls vorhanden, wird im Laufe der Optimierung mehrfach 
zur Uberprufung venvendet: Die Gute auf der Validierungsmenge liefert ein unabhangiges 
Mali fur den Fortschritt der Optimierung auf der Basis der Trainingsmenge und dient 
auSerdem z ur Verm e id u ng von Uberanpassung . 

Wahl der Faktoren 

In der Ausfuhrungsform besteht die Moglichkeit, Untermengen der Faktoren heranzuziehen, 
um beispielsweise Modelle fur solche zukunftigen Muster zu gewinnen, fur die nur diese 
Untermenge der Faktoren zur Verfugung steht. 
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Netzoptimierung 
Simplex-Optimierung 

Bei der Optimierung geht es urn die Suche nach einem Maximum der Likelihoodfunktion, 
bezogen auf die Daten der Trainingsmenge. Der Parameterraum der Suche besteht aus den 
n-K noch aktiven Netzgewichten zusammen mit den globalen Zeitkonstanten X^, k=1,...,K. 
Daraus ergibt sich ein n-dimensionaier Raum, in dem die Suche erfolgt 

Die in der Ausfuhrungsform implementierte Methode der Suche bedient sich der Konstruktion 
von einem n-fachen Simplex in diesem Raum nach der bekannten Methode von Nelder und 
Mead (1965). Die Suche erfordert die Bildung einer n-dimensionalen Simplex im 
Parameterraum. Eine Simplex laBt sich durch Vorgabe von n+1 nicht entarteten Ecken 
bestimmen, d.h., die entsprechenden Kanten sind alle linear unabhangig voneinander. Sie 
umfaBt somit eine n-dimensionale Punktwolke im Parameterraum. Die Optimierungssuche 
erfolgt in Epochen. Wahrend jeder Epoche wird die Gutefunktion auf der Trainingsmenge an 
verschiedenen Stellen im Parameterraum ausgewertet, namlich am aktuellen Ort sowie an n 
weiteren Ecken, die durch Zusammensetzung von Operationen wie Reflexion, 
Expansion/Kontraktion in einer Richtung, usw., definiert sind. Die Richtungen dieser 
Operationen werden auf der Basis der Werte der Gutefunktion an den zur vorigen Epoche 
definierten Ecken automatisch gewahlt Die Abnahme der Gutefunktion in der 
Ausfuhrungsform ist monoton, und die Suche endet immer bei einem (wenigstens lokalen) 
Minimum. 

Berucksichtigung der Vaiidierungsmenge 

Die oben beschriebene Vaiidierungsmenge dient, falls vorhanden, zur Kontrolle des 
Optimierungsfortschritts und zur Vermeidung von Uberanpassung. 

Als Kennzahlen der augenblicklichen GQte der Optimierung bezuglich der Trainings- und 
Validierungsmengen werden in der Ausfuhrungsform laufend die GroBen Minus Log-likelihood 
pro Muster der beiden Mengen berechnet und ausgegeben. WShrend diese Kennzahl auf der 
Trainingsmenge monoton abnehmen muB, sind vorubergehende Schwankungen der 
entsprechenden Kennzahl auf der Vaiidierungsmenge moglich, ohne dass eine 
Uberanpassung bereits stattgefunden hat. Ein monotoner Anstieg der Kennzahl auf der 
Vaiidierungsmenge sollte jedoch zum Abbruch der weiteren Optimierung und zu einer 
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Komplexitatsreduktion fuhren. Dieser Art der Abbruch stellt eine Art Notbremse fur die 
Verrneidung von Uberanpassung vor. 

Ein mogliches Abbruchkriterium, das automatisch durchgefuhrt werden kann, wird durch die 
Fuhrung der exponentiell geglatteten Gute der Validierungsmenge erreicht. Falls diese 
geglattete Kenngrolie das bisherige Minimum des aktuellen Optimierungsschritts um einen 
festen Prozentsatz uberschreitet (Verschlechterung der Gute), wird die Optimierung 
abgebrochen. Eine prozentuale Zunahme von etwa 1 % Toleranz wurde als Erfahrungswert fur 
typische GrofJen der Trainingsmenge um die 300 Oder mehr Datensatze festgestellt. Bei dieser 
Toleranz und bei etwa gleicher GroRe von Trainings und Validierungsmengen wird das 
Training ofter durch die Erreichung eines Minimums auf der Trainingsmenge gestoppt als 
durch die Verschlechterung der Gute auf der Validierungsmenge. Dieser "normale" Abbruch ist 
bevorzugt, weil eine (fast) monotone Verbesserung der Gute auf der Validierungsmenge ein 
Zeichen darstellt, dass das neuronale Netz echte zugrunde liegenden Strukturen, und nicht 
einfach das Rauschen, erkannt hat. 

Im Beispiel fur die Ausfuhrungsform wurde keine Validierungsmenge verwendet. Somit erfolgt 
der Abbruch allein aufgrund des Minimums auf der Trainingsmenge. 

Strukturoptimierung und Komplexitatsreduktion 

Aus der fur die Ausfuhrungsform beschriebenen Simplexoptimierung resultiert ein Satz von 
Gewichten {W[ij, ... w [n j} und anderen Parametern, welche ein lokales Minimum der negativen 
Log-Likelihood bestimmen. (Die Numerierung [1] ... [n] der Gewichte in diesem 
Zusammenhang beinhaltet nicht die topologische Ordnung der Gewichte.) Dieses Minimum 

bezieht sich auf die feste Zahl n der Gewichte und eine feste Topologie. Um Oberanpassung 

zu vermeiden, ist es wiinschenswert, durch eine Ausdunnung der Gewichte die Komplexitat zu 
verringem, soweit dies ohne einen signifikanten Verlust der Gute moglich ist. 

Ausdunnung (Pruning) bezeichnet die Deaktivierung von Konnektoren. Dazu werden deren 
Gewichte auf einen festen Wert "eingefroren" (in der Ausfuhrungsform null, wobei man auch 
vom "Entfernen" sprechen kann). Es ist im Prinzip moglich, einzelne Gewichte oder auch 
ganze Knoten zu entfernen. Im letzteren Fall werden alle Gewichte deaktiviert, die entweder in 
den zu entfernenden Knoten einfuhren oder aus dem Knoten weiterfuhren. 

In der Ausfuhrungsform wird eine Phase der Komplexitatsreduktion im Netz im Anschluli an 
einer Optimierungsphase (Simplex-Verfahren) durchgefuhrt. Der erste Schritt dazu ist die 
Ausdunnung" einzelner Konnektoren. Im AnschluB werden Kombinationen aus verschiedenen 
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Konnektoren im Hinblick auf Redundanz getestet. Schliefclich wird die Konsistenz der 
Topologie uberpruft und gegebenenfalls Konnektoren bzw. Knoten entfernt, die aufgrund der 
bisherigen Entfemung anderer Konnektoren und Knoten nicht mehr zur Aussage beitragen 
kbnnen. Diese Prozedur ist zwar nicht Gegenstand der Erfindung, gehort jedoch zur guten 
Praxis gemalS dem Stand der Technik. 

Zur Komplexitatsreduktion werden in der Ausfuhrungsform automatisch verschiedene 
statistische Hypothesen gebildet, die mittels eines Likelihood-ratio-tests bezuglich eines 
vorgegebenen Signifikanzniveaus uberpruft werden. Bestimmte Gewichte bzw. Parameter 
werden hierbei als obligatorisch betrachtet werden, d.h., sie werden auf keinen Fall entfernt. 
Dazu gehoren die globalen Zeitparameter Xo k . 

Rangfolge der Konnektoren 

Um die Reihenfolge der zu iiberpriifenden Konnektoren festzustellen, wird in der 
Ausfuhrungsform zunachst die TestgroBe log(Likelihood-Ratio) gebildet. Dabei stellt man sich 
fur jedes Gewicht w (A j zwei Netzwerke vor: 

• Das Netz mit alien aktuellen Gewichten (n Freiheitsgrade), einschliefilich w [AJ . 

• Das Netz mit alien aktuellen Gewichten auSer w [A1 , das deaktiviert wird (n-1 
Freiheitsgrade). 

Beim Netz mit w [A] deaktiviert werden die ubrigen Gewichte bei den aktuell optimierten Werten 
eingefroren. 

Testing 

Nachdem ein e R an gfolg e {w r i Jt ... w lnJ } der G e wichte gemaB dem "Likeli l loud- r a t io" bekannt i st, 

werden in der Ausfuhrungsform die in dieser Reihenfolge zwecks der Ausdunnung getestet, 
bis maximal G max Gewichte zu entfemen sind. Angenommen, A-1 Gewichte sind bereits 
entfernt worden, kann man fur das A-te zusatzliche Gewicht der Reihenfolge w [A] zwei 
Hypothesen testen. 

• Teststatistik fur die Hypothese H M : Likelihood-Ratio fur das Netz mit Gewichten {w m ... 
w^j } deaktiviert (n-A+1 Freiheitsgrade) 

• Teststatistik fur die Hypothesis H A : Likelihood-Ratio fur das Netz mit Gewichten {w m ... 
w [AJ } deaktiviert (n-A Freiheitsgrade) 

Die Hypothese H A wird nun zweimal getestet: 
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• H A versus H A -i und 

• H A versus H. 

Die Signifikanz wird mit dem Chi-Quadrat-Test bezuglich des Likelihood-Ratios angewandt. 
Falls bei einer der beiden Vergleiche H A angenommen wird (Ausdunnung von A ergibt eine 
signifikante Verschlechterung), wird der Konnektor A nicht entfernt, und der 
Ausdunnungsschritt wird beendet. 

Beim Deaktivieren wird der Konnektor aus der Liste der aktiven Konnektoren entfernt und das 
zugehorige Gewicht eingefroren (meinstens gleich null). 

Wahrend einer Ausdunnungsphase wird in der Ausfuhrungsform die Zahl G der entfernten 
Konnektoren auf eine maximale Zahl G max =n/10 begrenzt, wobei n die Anzahl der 
verbleibenden Konnektoren ist. 

Weitere Komplexitatsreduktion 

In der Ausfuhrungsform werden durch paarweise Analyse der Gewichte im Hinblick auf die 
Likelihood der Daten und unter Berticksichtigung verschiedener Korrelationseigenschaften 
we itere Konnektoren entfernt. Dieser Schritt ist jedoch nicht zwingend erforderlich fur die 
Funktion des lernfahigen Modells und kann daher weggelassen werden. Ebenso ist es 
moglich, die Erfindung mit anderen Techniken zur Komplexitatsreduktion, die in verschiedenen 
lernfahigen Systemen eventuell bereits implementiert sind, zu verbinden. 

Uberprufung der Topologie 

Ausdunnung oder Entfemung einzelner Konnektoren kann zur isolierung eines Knotens von 
Eingangssignalen, Ausgangssignalen, oder (im Falle eines versteckten Neurons) von beiden 
fuhren. In diesem Fall wird in der Ausfuhrungsform ein Deaktivierungsflag fiir den Knoten 
gesetzt. Fur Neuronen der Ausgangsschicht bedeutet z.B. "Isolierung 1 ', dass weder von der 
Eingangsschicht, noch von der versteckten Schicht aktive Konnektoren vorhanden sind. Falls 
alle Konnektoren von einem Eingangsneuron zur versteckten und zur Ausgangsschicht 
entfernt worden sind, ist der Bias der linearen Konnektoren auch zu deaktivieren. 

Ein verstecktes Neuron, das von alien Eingangen isoliert worden ist, kann noch mit Ausgangen 
verbunden ist. Die "eingefrorenen" Beitrage solcher versteckter Neuronen zum Ausgang sind 
dann redundant, weil sie im Prinzip nur die Biaswerte der ubrigen, aktiven Konnektoren 
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verandern. Daher werden solche Neuronen deaktiviert, und verbleibende Konnektoren zur 
Ausgangsschicht werden entfernt. 

Die verschiedenen Uberprufungen kdnnen zur weiteren Isolierung von Knoten fuhren. Deshalb 
wird die Prozedur solange iteriert, bis die Topologie konstant bleibt 



Beenden des Trainings und Ausgabe 

Wenn nach der letzten Simplex-Optimierung keine weiterere Komplexitatsreduktion moglich 
ist, wird in der Ausfuhrungsform das Training beendet Alle Gewichte und sonstige Parameter 
erhalten ihre endgultigen Werte, die in hierfur angelegten Dateien gespeichert werden. 

Somit ist das trainierte neuronale Netz eindeutig bestimmt. Durch Einlesen dieser 
gespeicherten Werte kann entweder gleich anschlieSend Oder zu einem zukunftigen Zeitpunkt 
das trainierte neuronale Netz gemaS der obigen Beschreibung verwendet werden, urn fur 
beliebige Daten, welche die unabhangigen Faktoren („Kovariaten u ) x enthalten, die 
Ausgabewerte und somit die oben definierten Funktionen f k (f), X k (/), und S k (f) t zu den 
Kovariaten x zu gewinnen. Mit diesen Funktionen ist das Wahrscheinlichkeitsmodell nun 
bestimmt. 

Insbesondere ist es selbstverstandlich moglich, den Verlauf dieser Funktionen in Abhangigkeit 
von gewahlten Faktoren, auszurechnen. Eine solche abhangige Bestimmung ist zur 
Evaluierung der erwarteten Wirkung eines Therapiekonzeptes sinnvoll, w^nn d\o 7n 
bewertenden Therapien als M Faktoren" zum Training verwendet worden sind. 

Beispiel 
Daten 

Zur Veranschaulichung der Funktionsweise der Erfindung in der Ausfuhrungsform wurden 
zunachst 1000 fiktive Patientendatensatze mit 9 Faktoren (Kovariaten) mittels eines 
Zufallsgenerators erzeugt Die ersten 7 Faktoren wurden als Realisierungen einer 
multivariaten GauSverteilung erzeugt Hierfur wurden im Ausfuhrungsbeispiel Mittelwerte und 
Varianzen der Faktoren und eine Kovarianzmatrix vorgegeben: 
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Faktor 




xer 


xpr 


xage 


xtum 


xupa 


xpai 


Mittelwert 


0.50 


0.45 


0.45 


0.50 


0.5.1 


0.50 


0.50 


Varianz 


0.071 


0.087 


0.097 


0.083 


0.083 


0.084 


0.083 



Die angenomrnene Kovarianzmatrix war 



xlypo jxer xpr xage xtum xupa xpaj 

xlypo"" 1.00 -0.06 -0.09" 0,03 0.42 o!"02 0.05 

xer -0.06 1.00 0.54 0.29 -0.07 -0.18 -0.19 

xpr -0.09 0.54 1.00 0.03 -0.06 -0.07 -0.14 

xage 0.03 0.29 0.03 1.00 0.04 0.02 0.00 

xtum 0.42 -0.07 -0.06 0.04 1.00 0.03 0.06 

xupa 0.02 -0.18 -0.07 0.02 0.03 1.00 0.54 

xpai 0.05 -0.19 -0.14 0.00 0.06 0.54 1.00 



Um eine moglichst realistische Situation darzustellen wurden diese Werte in der 
GroSenordnung so gewahlt, wie sie in der wissenschaftlichen Literatur im Falle des 
Mammakarzinoms fur bestimmte Faktoren bekannt sind. Fur die Funktion der Erfindung sind 
die genauen Annahmen sowie die Interpretation der Faktoren jedoch vollig unerheblich. 

Neben den sieben benannten Faktoren wurden zwei weitere binare Faktoren ( M Therapien") „ct" 
und „ht u zufallig erzeugt. Fur ht wurden zufallig 50 % der Wert 1, 50 % der Wert 0 zugeordnet. 
Im Ausfuhrungsbeispiel fur ct wurden nur 1 % der Wert 1 , 99 % der Wert 0 zugeordnet. Somit 
ist zu erwarten, daR ct nicht im neuronalen Netz als EinfluBfaktor erkannt wird. 

Die ersten zehn der hieraus resultierenden Datensatze sind wie folgt: 



Patienten- 


xlypo 


xer 


xpr 


xage 


xtum 


xupa 


xpai 


ct 


ht 


Nummer 


1 


0.07 


0.89 


1.41 


0.36 


0.49 


0.31 


0.22 


0 


1 


2 


0.25 


0.23 


0.98 


0.15 


0.10 


0.31 


0.05 


0 


0 


3 


0.56 


0.52 


0.79 


0.09 


0.22 


-0.22 


-0.07 


0 


1 


4 


0.61 


0.83 


1.10 


0.73 


0.56 


0.21 


0.44 


0 


1 


5 


0.97 


0.38 


0.70 


0.61 


0.51 


0.97 


0.72 


0 


0 


6 


0.44 


0.22 


0.07 


0.90 


0.80 


0.60 


0.55 


0 


1 


7 


0.46 


0.24 


0.47 


0.14 


0.60 


0.57 


0.31 


0 


0 


8 


0.42 


0.60 


0.41 


0.36 


0.54 


0.23 


0.47 


0 


0 


9 


-0.01 


0.22 


0.80 


0.52 


0.38 


-0.13 


0.41 


0 


0 


10 


0.80 


0.41 


0.19 


0.11 


0.45 


0.40 


0.51 


0 


0 



Fur den Einfluli der Faktoren auf einen Krankheitsverlauf wurden zunachst drei unabhangige 
Risikowahrscheinlichkeiten risk(i), i=1,3 erzeugt. Folgendes Modell wurde unterstellt: 
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risk(1)=exp(ri+r 2 +r3+r 4 -r h ) risk(2)=exp(ri+r 3 +r 4 ) risk(3)=exp(ri) 
mit 

n=2 (xlypo-median(xlypo)) 
r 2 =0,5 (xtum-median(xtum)) 
r 3 ~0 t 75 (xupa-median(xupa)) 
r 4 =1,5 (xpai-median(paimed)) und 
r h =1 falls ht=1. 

Aus diesen Risikowerten wurden tatsachliche Versagenszeiten der drei Auspragungen als 
zufallige Realisierungen einer Exponentialverteilung bzw. einer modifizierten 
Exponentialverteilung mit Zeitkonstante 200 Monate erzeugt Fur die 3. Auspragung wurde 
zusatzlich angenommen, daS ein Versagen nach spatestens 24 Monaten moglich ist, urn eine 
Situation mit konkurrierenden Risiken ahnlich dem Lokalrezidiv beim Mammakarzinom zu 
erzeugen. Diese Daten wurden gemaS einer simulierten „Studie" zensiert, und eine 
M Beobachtung" wurde nach dem Schema der unter Abbildung 1 dargestellten Prioritat 
simuliert. 



Aus dem im Ausfuhrungsbeispiel unterstellten Modell geht hervor, daB fur das Versagen der 3. 
Auspragung nur der Faktor „xlypo" kausal ausschlaggebend ist. Dennoch besteht ein indirekter 
Zusammenhang zwischen den ubrigen Faktoren und den Beobachtungen der 3. Auspragung, 
weil erhohte Risiken der ubrigen Faktoren die Wahrscheinlichkeit fur eine Beobachtung des 
Versagens der 3. Auspragung senken konnen. Diese Eigenschaft des unterstellten Modells ist 
zwar unerheblich fur die Funktion der Erfindung, veranschaulicht aber einen typischen Nutzen. 

Trainiertes neuronales Netz 

Die Neuronen der Ausgangsschicht werden gemaS den Gleichungen 4 bis 7 und 10 mit 
Ntime = 1 und N kB y = 3 zugeordnet, so dali 3 Neuronen der Ausgangsschicht ursprunglich aktiv 
sind. Fur die Ausfuhrungsform werden jeweils 9 Neuronen der Eingangs- bzw. der versteckten 
Schicht ursprunglich aktiviert. Das nach der beschriebenen Methode trainierte neuronale Netz 
wird in der Figur 3 veranschaulicht Cxpai" und „xpai1" sind identisch). Man beachte, dass zum 
Ausgang „03 M nur ein Konnektor vorhanden ist, und zwar vom Knoten (Neuron) „xlypo". Die 
Ausgange Q1 bis 03 sind den Risiken tt risk(1) H bis n risk(3)" zugeordnet. 

Eine vollstandige eindeutige Darstellung des trainierten neuronalen Netzes erfolgt durch 
Angabe der verbleibenden Konnektoren mit ihren zugehorigen Gewichten und Bias-Werten 
sowie durch die Uberlebenszeitskalen. Hierfur werden in der Tabelle 2a fur jedes Neuron, zu 
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dem ein aktiver Konnektor fuhrt ( M tgf ), alle Quellen („src") mit den entsprechenden Gewichten 
(„wt ,f ) angegeben. Man beachte, daB viele Konnektoren nicht mehraktiv sind. 



tgt 


src 


wt 


src 


wt src 


wt src 


wt 


src 


wt src 


wt src 


wt src 


wt src 


wt 


hi 


ht 


13.5 






















h6 


xlypo 


0.53 


xupa 


-1.78 xtum 


1.02 
















h7 


xer 


1.98 


xpr 


-1.37 


















h8 


xage 


1.70 






















h9 


xpr 


2.31 






















o1 


hi 


-1.70 


h6 


0.30 ht 


-1.10 xlypo 


0.19 


xpai 


0.72 xupa 


0.63 xtum 


0.22 






o2 


hi 


2.03 


h6 


-0.68 h7 


-0.86 h8 


0.33 


h9 


-0.64 xlypo 


0.64 xpail 


0.91 xer 


0.56 xage 


-0.42 


03 


xlypo 


2.39 























Tabelle 2a 



Die Bias-Werte sind wie in der Tabelle 2b angegeben: 

ht xlypo xpai xupa xtum ct xer xage xpr hi h2 h3 h4 h5 h6 h7 h8 hi ol o2 o3 
0.17 0.16 0 0 0 0 0 0 0 -0.94 0 O 0 0 0.86 1.31 0 2.07 1.03 0.66 -0.11 

Tabelle 2b: Bias Werte (automatisch 0 fur inaktive Neuronen) 

Die Werte der fur die Spezifikation des Modells der Gleichung 6 notwendigen 
Oberlebenszeitskalen Xo k sind schlieSlich der Tabelle 2c zu entnehmen (die Einheiten dieser 
Angaben entsprechen sinnvollerweise der obigen Zeitkonstante von 200 Monaten): 



X01 


Xo2 




0.53/200 


0.13/200 


0.27/200 



Tabelle 2c 



Zeitliche Variation 

Um zeitlich variierende Ausgangsneuronen zu verwenden, konnte start N t i me = 1 wie hier 
verwendet ein hoherer Wert eingesetzt werden. Die Anzahl der Ausgangsneuronen bestimmt 
sich dann aus der Gleichung 10.d. Im Falle N key = 3 und N« me = 2 ware dann z.B. N Q = 6. Das 
Training wurde auf die bisher beschriebene Weise erfolgen. Die eventuellen zeitlichen 
Variationen der verschiedenen Auspragungen konnten im Rahmen des Modells der 
Gleichungen 4 bis 7 unabhangig von einander bestimmt werden, die Aufgabe der Erfassung 
konkurrierender Risiken wurde hierdurch insbesondere keinesfalls beeintrachtigt werden. 



BNSDOCID: <WO 0247026A2_I_> 



WO .,2/47,26 _ _ PCT/EP01/144I1 

29 



Patentanspruche 



1. Verfahren zur Ermittlung konkurrierender Risiken fur Objekte nach einem Anfangsereignis 
auf Grundlage bereits gemessener oder sonst objektivierbarer Trainingsdatensatze, in 
welchem mehrere aus einem lernfahigen System gewonnene Signale in. einer objektiven 
Funktion so kombiniert werden, dass das lernfahige System die zugrunde liegenden 
Wahrscheinlichkeiten der jeweiligen konkurrierenden Risiken erkennen oder vorhersagen 
kann. 

2. Verfahren nach Anspruch 1, in welchem fur die Trainingsdatensatze gemessene oder in 
sonstiger Weise objektiv erfafcte Daten des Anfangsereignisses und einer 
Nachbeobachtung bis zu einem vorgegebenen Zeitpunkt verwendet werden. 

3. Verfahren nach Anspruch 2, in welchem der letzte Zeitpunkt der Nachbeobachtung explizit 
in den Trainingsdatensatzen verwendet wird. 

4. Verfahren nach einem der vorangegangenen Ansprtiche, in welchem bei der Beobachtung 
einer Versagensauspragung zu einem Zeitpunkt die anderen Auspragungen 
ausgeschlossen werden. 

5. Verfahren nach einem der vorangegangenen Ansprtiche, in welchem die objektive 
Funktion L in Abhangigkeit einer Funktion P gegeben ist 

wobei p die Parameter des lernfahigen Systems, /„ (Jt>Sy) (/ y ) die Versagensrate der 
Auspragung k und S^^tj) den Erwartungswert des Anteils an Objekten j mit 
beobachteten Merkmalen x y , welche kein Versagen der Auspragung k zum Zeitpunkt tj 
erleiden, bezeichnen und P aufgrund des logischen Zusammenhangs aus 5 jk bestimmt 
wird, mit 5 jk =1, wenn ein Objekty ein Versagen der Auspragung k zum Zeitpunkt tj erlitten 
hat und sonst 6 jk = 0. 

6. Verfahren nach Anspruch 5, in welchem 
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als objektive Funktion verwendet wird, wobei s jk und \|/ jk aufgrund des logischen 
Zusammenhangs aus 5 jk bestimmt werden. 



7. Verfahren nach Anspruch 6, in welchem 



als objektive Funktion verwendet wird. 

8. Verfahren nach einem der vorangegangenen Anspruche, in welchem ein neuronales Netz 
als lernfahiges System verwendet wird. 

9. Verfahren nach Anspruch 8, in welchem ein neuronales Netz der Architektur MLP (multi- 
layer Perzeptron) verwendet wird. 

10. Verfahren nach einem der Anspruche 1 — 7, in welchem das lemfahige System eine 
rekursive Partitionierung durchfuhrt, wobei 

jedem Objekt einem Knoten zugeordnet wird, 

jedem Knoten die Haufigkeiten oder Wahrscheinlichkeiten aller Auspragungen zugeordnet 
wird, und 

die Partionierung so durchgefuhrt wird, dass die objektive Funktion optimiert wird, die diese 
Haufigkeiten oder Wahrscheinlichkeiten statistisch berucksichtigt 

11. Verfahren nach einem der vorangegangenen Ansprfiche, in welchem das lemfahige 
System im Rahmen einer Entscheidungshilfe verwendet wird. 

12. Verfahren nach einem der vorangegangenen Anspruche, in welchem den verschiedenen 
Wahrscheinlichkeitsfunktionen der konkurrierenden Risiken Werte zur Ermittlung einer 
Strategie zugeordnet werden. 
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Figur 1 
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Figur 2 
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